AI032
Programación de procesadores altamente paralelos: un enfoque práctico
Optimización de memoria y tiling de memoria compartida
Objetivos de aprendizaje
- Comprender la jerarquía de la memoria de GPU y sus características de latencia
- Identificar patrones para el agrupamiento de memoria global
- Implementar estrategias de tiling 1D y 2D utilizando memoria compartida
- Analizar y mitigar conflictos de bancos de memoria compartida
- Comparar las ganancias de rendimiento entre implementaciones con tiling y sin tiling